RDA: Agente de diseño de recompensas para aprendizaje por refuerzo Descubre RDA, un agente basado en VLM que diseña recompensas semánticas para robots. Logra políticas alineadas con instrucciones humanas en manipulación. 2026-06-02 · 2 min